2018-2019百迈客Hi-C基因组研究合作文章十连发
随着高通量测序技术的发展,越来越多的物种基因组密码信息已破译,但越来越多的物种因为难以构建遗传群体,而无法获得遗传图谱,所以早期研究中大多数的物种没有组装到染色体水平,对于后续动植物的表观基因组研究存在极大的障碍。
Hi-C是染色质区域捕获(Chromosome conformation capture)与高通量测序(High-throughput sequencing)相结合而产生的一种新技术。该技术可以利用单个个体就可以将基因组序列定位到染色体水平,从而进行染色体水平的研究。
Hi-C实验流程图
北京百迈客生物科技有限公司自2016年初推出Hi-C研究技术以来,目前拥有上百成功案例,百迈客更是自主开发Hi-C排图软件(已申请专利如下),也是中国市场上能独立完成Hi-C实验——数据分析的测序企业之一。
Paper 1:亚洲棉基因组迭代更新
2018年5月8日,中国农业科学院棉花研究所所长李付广研究员、武汉大学朱玉贤院士、中国农业科学院棉花研究所杜雄明研究员、中国农业科学院农业基因组研究所所长黄三文研究员、林涛博士与北京百迈客生物科技有限公司关于亚洲棉的合作成果发表在Nature Genetics上,论文题目为“Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits”。利用三代PacBio测序+Hi-C技术完成了亚洲棉基因组的重新组装,将基因组Contig N50从72 kb提升到1.1 Mb,为亚洲棉后续的群体遗传学等相关研究奠定了基础。
图1 两版亚洲棉基因组Hi-C热图比对
Paper 2:同源多倍体甘蔗基因组破译
2018年10月8日,福建农林大学基因组研究中心明瑞光课题组首次完成了同源多倍体甘蔗基因组密码破译,该研究成果"Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L."刊登于Nature Genetics。文中利用二代BAC文库测序,三代PacBio测序及Hi-C研究技术,成功地将甘蔗基因组组装到染色体水平,进而对同源四倍体甘蔗 AP85-441的多倍化,等位基因的优势表达,C4途径,抗病性等进行了研究。文中利用北京百迈客生物科技有限公司的Hi-C建库测序技术,并结合明瑞光课题组独立研发的ALLHiC算法成功地将甘蔗基因组组装到染色体水平,高质量甘蔗基因组的获得印证了百迈客Hi-C研究在科研领域中的绝对优势。
图2 甘蔗同源多倍体甘蔗基因组Hi-C热图
Paper 3:陆地棉和海岛棉基因组迭代更新
2018年12月4日,华中农业大学作物遗传改良国家重点实验室张献龙课题组首次通过三代测序(PacBio)+光学图谱(BioNano)+Hi-C技术完成了异源四倍体陆地棉(Gossypium hirsutum)和海岛棉(Gossypium barbadense)基因组组装。该研究成果以“Reference genome sequences of two cultivated allotetraploid cottons Gossypium hirsutum and Gossypium barbadense”为题刊登于Nature Genetics,文中利用北京百迈客生物科技有限公司的三代PacBio测序技术、Hi-C染色体挂载技术及基因组组装技术,获得了高质量栽培种异源多倍体棉基因组。
图3 陆地棉和海岛棉基因组Hi-C热图
Paper 4:陆地棉TM-1和ZM24泛基因组研究
2019年07月05日,Nature Communications在线发表了中国农业科学院棉花研究所与北京百迈客生物科技有限公司共同合作文章“Extensive intraspecific gene order and gene structural variations in upland cotton cultivars”, 中国农业科学院棉花研究所杨召恩博士为本文第一作者,李付广研究员为通讯作者。文中利用了北京百迈客生物科技有限公司的PacBio SMART长reads和Hi-C技术组装了TM-1和ZM24的基因组,组装TM-1基因组2.286 Gb(contig N50=4.760 Mb);组装ZM24基因组2.309 Gb(contig N50=1.976Mb),并挂载到26条染色体上,预估覆盖度超过组装结果的99%。同时在 ZM24和TM-1的A08染色体上鉴定到了大的倒位变异,并在该倒位区域内的单倍型分组信息及基于300,000多个SNPs的系统发育分析同样将大量的陆地棉种质进行了类似的聚类,开发的基因组资源可以促进基础植物生物学研究和棉花应用育种。
图4 陆地棉TM-1和ZM24基因组Hi-C热图
Paper 5:杂草稻基因组见刊
2019年1月30日,沈阳农业大学水稻研究所杂草稻课题组与北京百迈客生物科技有限公司等单位合作,成果以“Population Genomic Analysis and De novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary Game”为题发表在国际著名植物学期刊Molecular Plant上。文中利用北京百迈客的单分子实时测序(SMRT)、高通量NGS和染色质构象捕获(Hi-C)技术组装了高质量的亚洲高纬度杂草稻WR04-6基因组,进而应用群体遗传学、演化场景推演、比较基因组学等生物大数据分析方法,揭示了栽培稻在从野生稻驯化后,近代的遗传改良成为了亚洲高纬度杂草稻与粳型栽培稻遗传趋异的分水岭,高纬度杂草稻“杂草化”的实质是基因组的半驯化“semi-domestication”。
图5 杂草稻基因组Hi-C热图
Paper 6:构树基因组发表
2019年2月26日,中国科学院植物研究所北方资源植物重点实验室与北京百迈客生物科技有限公司等单位合作,成果以“A Chromosome-Scale Genome Assembly of Paper Mulberry (Broussonetia papyrifera) Provides New Insights into Its Forage and Papermaking Usage”为题发表在国际著名植物学期刊Molecular Plant上。文中利用北京百迈客最新测序技术,结合光学图谱,HIC测序和高密度遗传图谱,成功构建了高质量的构树全基因组谱图,达到了准染色体水平的组装,为进一步改良构树的农艺性状奠定了基础。此外,利用构树的全基因组序列以及转录组数据,对构树的进化历史、基因组功能注释和物种间的基因组共线性等进行解析;还对构树的纤维发育、木质素和黄酮类代谢、氮代谢以及金属耐受性和抗逆性等相关重要基因展开了深入研究。
图6 构树基因组Hi-C热图
Paper 7:香蕉基因组组装
2019年7月15日,由中国热带农业科学院热带生物技术研究所金志强研究员牵头完成的题为“Musa balbisiana genome reveals subgenome evolution and functional divergence”的研究论文在线发表于知名期刊Nature Plants。文中利用了PacBio三代单分子测序和北京百迈客生物技术有限公司的Hi-C技术绘制了双单倍体香蕉野生种Pisang Klutuk Wulung (B-基因组, 2n=2x=22)基因组精细图谱,进一步对9份香蕉种质材料进行了重测序分析,及对44份香蕉材料进行了转录组测序分析。该研究在获得了香蕉B基因组的高质量基因组的同时,为香蕉基因组进化及功能分化提供了新的见解。
图7 香蕉基因组Hi-C热图
Paper 8:异源多倍体花生基因组
2018年6月19日,河南农业大学殷冬梅教授团队与北京百迈客生物科技有限公司、中国科学院等多家单位联合攻关,成功破译复杂的异源四倍体野生花生基因组密码,相关成果“Genome of an allotetraploid wild peanut Arachis monticola: a de novo assemble”发表于Giga Science上。文中充分利用SMRT + Hi-C + IRYS + Illumina等测序平台技术优势,采用最先进的基因组组装技术成功破译了四倍体野生花生基因组,最终得到染色体水平的高质量野生花生参考基因组。组装基因组大小为2.62 Gb,为预计基因组大小的97%,contigs N50和scaffolds N50分别为106.66 Kb,124.92 Mb,其中96.07%的序列挂载到20条染色体上,91.83%的序列可以确定顺序和方向。野生花生基因组的发布对于理解花生属和豆科作物进化具有重要的科学价值,促进花生以及其他油料作物的功能基因组学发展和分子育种。
图8 异源四倍体花生基因组Hi-C热图
Paper 9:猕猴桃基因组迭代更新
2019年4月1日,由安徽农业大学教授刘永胜团队和美国康奈尔大学教授费章君团队共同领导,参与单位包括四川大学、合肥工业大学等高校等科研机构,与北京百迈客生物科技有限公司合作,构建了毛花猕猴桃品种“华特”基因组的精细图谱,研究成果“Chromosome-scale genome assembly of kiwifruit Actinidia eriantha with single-molecule sequencing and chromatin interaction mapping”发表于Giga Science上。文中利用北京百迈客生物科技有限公司的三代测序技术(单分子测序)和Hi-C染色质构象捕获技术,组装毛花猕猴桃品种“华特”基因组的大小约为690.6 Mb,N50为21.7 Mb,大约99%的序列挂载到29条染色体上。毛花猕猴桃基因组包含43%的重复序列和42850个基因,其中39075个基因与其它物种高度同源。这项研究不仅证实了猕猴桃进化过程中两次近代基因组倍增历史事件对物种分化和物种形成的影响,而且进一步揭示猕猴桃富营养成分诸如维生素C、类胡萝卜素、叶绿素和类黄酮等的基因组学机制,为猕猴桃品质改良和遗传育种奠定了坚实基础。
图9 毛花猕猴桃基因组Hi-C热图
Paper 10:魁蚶基因组发表
2019年7月9日,黄海水产研究所王崇明研究员团队、杨爱国研究员团队与德国阿尔弗雷德·韦格纳研究所赫尔姆霍兹极地和海洋研究中心UmbertoRosani博士等与北京百迈客生物科技有限公司合作,成功破译魁蚶基因组,研究成果“Chromosomal-level assembly of the blood clam,Scapharca (Anadara) broughtonii, using long sequence reads and Hi-C”发表于Giga Science上。研究中利用北京百迈客生物科技有限公司的二、三代测序和Hi-C染色体构象捕获技术,构建了国际上首个染色体水平的蚶科动物基因组参考图谱。研究揭示魁蚶基因组大小为885 Mb,成功将99.35%的组装序列挂载到染色体上,经进一步分析发现魁蚶基因组中重复序列高达408 Mb,占基因组总长的46%。该项研究成果为蚶科贝类抗病抗逆、生长发育等重要性状的遗传解析以及种质改良等相关研究提供了重要理论支撑。
图10 魁蚶基因组Hi-C热图
文章即是科研实力的综合体现,北京百迈客自启动Hi-C技术研究以来,完成上千个物种,近万个文库构建;文库含酶切位点有效数据比例最高达93%以上,针对物种推出定制化内切酶服务;实现多倍体物种的Hi-C辅助基因组组装,挂载效率最高达100%;具有实验+生物信息分析专利保护,成为行业内最具优势的企业。